رت و ارف هنن 68 :۱022067/0 :01 سال سی و چهارم, شمارة سهء ۱۶۰۰ 


ارزبابی پتانسیل روان گرایی خاک در اثر وقوع زمین لرزه بااستفاده از چند الگوریتم طبقه‌بندی هوشمند در 
نرم‌افزار م0 ۴ 


هادی فتاحی ٩‏ فاطمه جیریایی( 


چکیده یکی از پیامدهای احتمالی وقوع زمین‌گرزه در زمین‌های اشباع, روانگرایی خاک و در نتیج ‏ آن شکست و خرابی فونداسیون ساختمان‌ها, 
انواع زیرساخت‌هاء پل‌ها و بسیاری فجایع دیگر می‌باشد. در این تحفیّق سعی شد به‌منظور ارزیابی پتاسیل روا نگرایی حاک برروی ۷٩‏ نمونه از 
پایگاه دادة زلزلةٌ تنگشان کشور چین, چند مدل طبقه‌بندی هوشمند با کمک نرم‌افزار 06086 ساخحته شود. به همین منظور عملکرد ۵ روش 
طبه‌بندی هوشمند (رگرسیون لاجستیک, شبکه عصبی مصنوعی (۸۷۷) ماشین بردار پشتیبان (/0۷8), نزدیک‌ترین همسایک ی(۷۷) و جنکل 
تصادفی) براساس معیارهای مختلف با هم مقایسه شدند. ننایج نشان داد روش‌های 5۷7 ۸3۷۷و رگرسیون لاجستیک از توانایی بالایی برای 
پیش‌بینی کلاس روا نگرایی نعاک برحوردار هستند و در بين آنها روش رگرسیون لاجستیک با مقدار شانعص ۹۸(۸/) به‌عنوان بهترین 
روش انتحاب شد. علاوه‌بر اين» بررسی تأثیرگذاری متغیرها بااستفاده از چهار معیار بهرةُ اطلاعاتی, بهرُ اطلاعاتی نسبی» شانعص جینی و 
شاعص 1۳/160۳ بیالگر این است که متغیر مقاومت نوک مخحروط د رآزمایش نفوذ محروطی موثرترین روش است و در اولویت اول قرار 


می‌گیرد. هم‌چنین متغیرهای نسبت تنش تناوبی و حداکثر شتاب افقی زلزله در سطح زمین ویژگی‌های مهمی بهحساب میآیند. 
واژه‌های کلیدی زمین‌لرزه. روان‌گرایی» الگوریتم‌های طبقه‌بندی هوشمند نرم‌افزار 072086 
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۵ 0۳2126 ص ماتمعاد صمتایاععدان 
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* تاریخ دریافت مقاله۱8۰۰/۲/۱۳ و تاریخ پذیرش آن ۱۶۰۰/۱۰/۵ از صفحه ۳۹ تا ۵۲ می‌باشد. 
(۱) نويسنده مسئول دانشیان دانشکدة مهندسی علوم زمین. دانشگاه صنعتی اراک. ۵6۲ نالج نج ۵ تطه) ]۰ ۲۸۱۵۵۲۱۶ 


(۲) دانشجو دانشکدة مهندسی علوم زمین. دانشگاه صنعتی اراک. 


۳۹ 


مقد مه 

وجود لایه‌های سست و روان‌گرا و رخداد روان‌گرایی 
(همتاعدکهن10) در اثر پاسخ لرزه‌ای زمین یکی از 
مخرب‌ترین حوادث در حوزهُ ژئوتکنیک می‌باشد. از 
جمله پیامدهای روان‌گرایی می‌توان به کاهش مقاومت 
خاک و درنتیجه زمین‌لغزش‌ها. شکست و تخریب 
فونداسپون‌های. ساختمان‌ها و یل‌هه شناور شدن 
سازه‌های کم‌وزن مدفون در خاک. جوشش ماسه در 
سطح زمین» خروج آب از میان ترک‌های سطح زمین و 
رفتار ماسه‌گونة زمین‌های سخت اشاره کرد [1]. پدیده 
روان‌گرایی تنها در خاک‌های اشباع رخ می‌دهد. 
به‌طوری‌که در مناطق نزدیک آب مانند رودخانه‌ها؛ 
دریاچه‌ها. خلیح‌ها و اقیانوس‌ها اثرات تخریبی بیشتری 
دارد. در محیط‌های اشباع آب در میان ذرات خاک با فشار 
متعادلی که دارد ذرات خاک را در کنار هم نگه می‌دارد و 
مانع از حرکت آن‌ها می‌شود. با وقوع لرزش زمین, فشار 
آب میان منافذ خاک افزايش می‌یابد و ذرات خاک از 
حالت سکون خارج می‌شوند و در کنار هم شروع به 
و کته بش تفر کزان ال قازفت برشی سای 
به‌شدت کاهش می‌یابد و به صفر نزدیک می‌شود و 
موجب روان‌گرایی خاک می‌شود [3,2] . شکل (۱) 
چگونگی جابه‌جایی ذرات خاک در یک محیط اشباع پس 
ز و قوع زمین‌لرزه را نشان می‌دهد. 

ارزیابی پتانسیل روان گرایی خاک‌ها اغلب توسط 
آزمایش‌های صحرایی انجام می‌شود که دو مورد از 
مرسوم‌ترین آزمایش‌های نفوذی در محل آزمایش نفوذ 
ستاندارد (۲656 طمناجتامط۵ظ 0تعصهاه) و آزمایش نفوذ 
مخروطی (1690 ۳۵۵۵/۵/00 086) می‌باشد. از طرفی 
مروزه الگوریتم‌های طبقه‌بندی از مجموعهٌ تکنیک‌های 
داده‌کاوی توانایی بالایی در پش‌بینی طبقٌ متغیرهای 
چند کلاسه از خود نشان داده‌اندکه بااستفاده از آنها به‌جای 


روش‌های سنتی می‌توان یک مدل دقیق برای طبقه‌بندی 
داده‌ها ساخت و سپس از آنها در امر پیش‌بینی استفاده 
کرد. طبقه‌بندی یکی از شاخه‌های اساسی یادگیری ماشین 
و داده‌کاوی است و اساس ان داده‌های جمع اوری‌شده از 


نشریه مهندسی عمران فردوسی 


ارزیابی پتانسیل روا نگرایی نحاک در آثر وقوع زمینلرزه .. 


اعمال گذشته است [4]. محققان متعددی در این زمینه 
پژوهش‌هایی انجام داده‌اندکه به این شرح است: 

راماکریشنان و همکاران [5] با کمک الگوریتم شبكة 
مدل‌سازی کردند و مورد مطالعه قرار دادند. 

چرن و لی[6] از روشی برمبنای شبکة فازی-عصبی 
برای ارزیابی پتانسیل روان‌گرایی خاک استفاده کردند و 
سپس یک روش جستجو برای یافتن نقاط داده‌ها برروی 
تابع حالت حدی ارائه دادند. 
روان‌گرایی خاک مجموعه داده‌های آزمايش نفوذ 
مخروطی و طیف گسترده‌ای از پارامترها را با یک برنامة 

فاویا. تااسشفاده. او برن. از «شیکهای قضبی 
مصنوعی به تحلیل شش مسئلة ژئوتکنیکی پرداخت که 
پکن ادابم سای ارزتانی اسیل ژوان کرانی شا کم بات 
[8]. 

سامویی و سیتارام[9] به پیش‌بینی حساسیت 
روان‌گرایی خاک براساس داده‌های آزمایش نفوذ 
استاندارد پرداختند و به این منظور از دو روش یادگیری 
ماشین شبکهٌ عصبی مصنوعی و ماشین بردار پشتیبان 
استفاده کردند. 

فرخزاد و همکاران[10] به زون‌بندی روان‌گرایی 
خاک در شهر بایل پاستفاده از یک مدل شبکه عصبی 

مرت یک مقایسه بین روش‌های آنالیز روان‌گرایی 
انجام داد و جدولی برای راهنمایی تعیین روش و برنامة 
[11]. 

مودولی و داس [12 یک تکنیک تلفیقی هوش 
مصنوعی و برنامةٌ ژنتیک برای ارزیابی پتانسیل 
روان‌گرایی خاک براساس داده‌های آزمایش نفوذ 
استاندارد اجرا کردند. 

در این تحقیق به ارزیابی پنانسیل روان‌گرایی خحاک 


پرداخته خواهد شد. این ارزیابی برروی داده‌های میدانی 


سال سی و چهارم. شمارة سهء ۱۶۰۰ 


هادی فتاحی- فاطمه جیریایی 


آزمایش نفوذ مخروطی مربوط به زلزليهٌ تانگشان 
(محطوع‌صه 1) در کشور چین انجام می‌شود. به این منظور 
از ۵ مدل طبقه‌بندی هوشمند. رگرسیون لاجستیک 
ماشین بردار پشتیبان (6۷» نزدیک‌ترین همسایگی 
6 و جنگل تصادفی برای پیش‌بینی کلاس 
روان‌گرایی خاک استفاده خواهد شد. در این مدل‌ها 
پارامترهای بزرگی زلزله. سطح آب زیرزمینی» تنش قائم 
کل تنش موثر قائم. عمق, حداکثر شتاب افقی زلزله در 
سطح زمین» نسبت تنش تناوبی» ميانگین اندازهٌ دانه‌ها؛ 
مقاومت نوک مخروط اندازه‌گیری‌شده در آزمايش ۳۲ 
به‌عنوان پارامترهای ورودی و پتانسیل روان‌گرایی خاک 
به‌عنوان پارامتر خروجی می‌باشد و مسئله از نوع 
طبقه‌بندی است. مدل‌سازی‌ها در نرم‌افزار 07۵086 
صورت می‌گیرد. به‌علاوه آنالیز حساسیت پارامترها برای 


بررسی اهمیت آن‌ها انجام شده‌است. 


8 
۷ 
۰ 
۰ 
1 
1 
ما قفا ٩00‏ ُ 
۵ 0۳ , 


تکنیک‌های داده‌کاوی در بخش طبقه‌بندی 
وش 
استفاده از ابزار داده‌کاوی برای شناسایی الگوها و مدل‌ها 
و نیز ارتباط عناصر مختلف در پایگاه داده به‌منظور کشف 
دانش نهفته در داده‌ها و نهایتا تبدیل داده به اطلاعات 
روزبه‌روز ضروری‌تر می‌شود. در سال‌های اخیر استخراج 
و کشف سریع و دقیق اطلاعات با ارزش و پنهان از 
مجموعهٌ داده‌ها. به‌عنوان علم داده‌کاوی مورد توجه قرار 
گرفتهاست: که غنامل کازبره انزارهای معبلف برای تخلیل 
داده‌های مصنوعی و کشف یک الگوی ناشناختةٌ معتبر بر 
روابط بین مجموعه داده‌ها می‌باشد. در این بخش به 
توصیف برخی از تکنیک‌های داده‌کاوی مربوط به 


طبقه‌بندی پرداخته خواهد شد. 


شکل ۱: ساختار ذرات خاک اشباع قبل و پس از وقوع زمین لرزه [۳] 


سال سی و چهارم. شمارهُ دی ۱۶۰۰ 
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ارزیابی پتانسیل روانگرایی حاک در اثر وقوع زمین‌لرزه .. 
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شکل ۷:ساعتار بخش‌های یک سلول عصبی [۱۵] 


شبکة عصبی مصنوعی (۸(۲) 

می‌توان یک نرون عصبی انسان و عملکرد آن را 
توسط الگوهای ریاضی الگوسازی کرد. در پردازش 
اطلاخاک یک یکی ضرع آن یک تا نا غفتیی 
زیستی ایده می‌گیرد و مانند مغز به پردازش اطلاعات 
می‌پردازد. این سامانه از شمار زیادی عناصر پردازشی به 
نام نرون‌ها تشکیل شده‌است که برای حل یک مسئله با 
هم هماهنگ عمل می‌کنند. از این‌رو یک شبک؛ٌ عصبی 
مصنوعی برای انجام وظیفه‌ای مشخص مانند شناسایی 
الگوها و دسته‌بندی اطلاعات در طول یک فرآیند 
یادگیری تنظیم می‌شود. یک شبکهٌ عصبی مصنوعی, از 
سه لایةٌ ورودی» خروجی و میانی يا پنهان تشکیل 
می‌شود. ورودی‌ها در وزن‌های مخصوص خود ضرب و 
با هم جمع می‌شوند و در انتها به‌وسیلة تابع‌هایی خاص 
خروجی از روی ورودی تصمیم‌گیری می‌شود. نرون 
می‌تواند یک تابع ریاضی غیرخطی باشد. درنتیجه یک 
شبکةُ عصبی که از اجتماع اين نرون‌ها تشکیل می‌شود 
نیز می‌تواند یک سامانة کاملا پیچیده و غیر خطی باشد. 
یک سلول عصبی از پنج بخش اصلی تشکیل می‌شود که 
عبارتند از ورودی. وزن‌ها. تابع جمع. تابع فعال‌سازی و 
خروجی. ورودی‌ها. اطلاعات با داده‌های خامی هستند 
که به شبکه تغذیه شده‌است. وزن‌ها مقادیری هستند که 
اثر یک مجموعه ورودی یا یک عنصر ورودی لاية قبلی 
را در سلول جدید بیان می‌کنند. تابع جمع» تابعی است 
که اثر ورودی‌ها و وزن‌ها را به‌طور کامل برروی عنصر 
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وود نی همه ی کی پاش تاه( شنک غضفی : 
باید سیستم شبکه ابتدا آموزش ببیند. پس از اتمام 
آموزش» معمولا خطای شبکه به حداقل می‌رسد و 
خروجی شبکه نیز مشابه با خروجی هدف خواهد شد 
14,131 شکل (۲) ساغار بش های: یک سلول یی 
در یک شبکهةٌ عصبی مصنوعی را نشان می‌دهد. 


ماشین بردار پشتیبان. یکی از روش‌های یادگیری با 
نظارت است که از تئوری یادگیری آماری سرچشمه 
می‌گیرد و از آن برای طبقه‌بندی و رگرسیون استفاده 
می‌کنند. ]8۷۷ پیشگویی‌های خود را بااستفاده از ترکیبی 
خطی از تابع کرئل که برروی مجموعه‌ای از داده‌های 
آموزشی با نام بردارهای پشتیبان عمل می‌کند انجام 
می‌دهد. در تقسیمبندی خطی داده‌هاء سعی می‌شود خطی 
انتخاب شود که حاشية اطمینان بیشتری داشته باشد. یکی 
از خصوصیات مهم بردار پشتیبان این است که به‌طور 
هم‌زمان خطای تجربی طبقه‌بندی را کمینه و حاشیه‌های 
هندسی را بیشینه می‌کند؛ بنابراین طبقه‌بندی بیشینه کنندة 
حاشیه نیز نامیده می‌شود. در ماشین بردار پشتیبان. هدف 
به حداکثر رساندن حاشیهٌ بین دو کلاس است؛ بنابراین 
ابرصفحه‌ای انتخاب می‌شود که فاصلة آن از نزدیک‌ترین 
داده‌ها در هر دو طرف جداکنندة خطی, بیشینه باشد. این 


ابرصفحه از طریق رابطةٌ زیر به‌دست می‌آید [15]. 


سال سی و چهارم. شمارة سه. ۳۹۹2 


هادی فتاحی- فاطمه جیریایی 
)۱ 0 < 9 + ۷۷۲۵00 


در اين رابطه بردار وزن ۷ برداری عمود بر 
اندازه‌گیری فاصلهٌ اپرصفحه تا مبداً استفاده می‌شود. 
()۵ کرنلی برای انتقال داده به فضایی با ابعاد بالاتر 


است. 


نزدیک ترین همسایگی (16(۷) 


به‌طور کلی الگوریتم نزدیک‌ترین همسایگی دوکاربرد 
دارد. کاربرد اول تخمین تابع جگالی توزیع داده‌های 
تعلیم و کاربرد دوم طبقه‌بندی داده‌های تست می‌باشد. 
اساس کار اين روش تخمین ویژگی‌های یک سری 
داده‌های مجهول باتوجه به بيشترین شباهت این داده‌ها با 
داده‌های معلوم که در همسایگی یا نزدیکی آنها قرار 
یا رابطه‌ای برای محاسبهٌ فاصلهٌ بین داده‌های مورد 
آزمایش و داده‌های تعلیم می‌باشد که در اکثر موارد از 
فاصله اقلیدسی در رابطةً زیر استفاده می‌شود [16]. 
)۲( 7 
۳ ۳ < (4)0.0 
<-ز 
7 تعداد فیلدهای هر رکود است و 8 و :4 مقادیر 
ویژگی ام برای رکودها هستند. ابتدا فاصلهٌ رکورد جدید 
از همه رکوردهای افو ی محاسبه می‌شود. سپس >1 
نزدیک‌ترین رکوردها را به نمونهٌ جدید براساس یک 
معیار شباهت به‌دست می‌آورد و دسته‌های این > همسایه 
را بررسی می کند. در آخره دسته نمونهة حدید را برابر با 
بیشترین دسته در 16 همساية آن قرار می‌دهد. 


رگرسیون لاجستیک 


در تحلیل مسائل چندمتغیره در حالتی‌که متغیر هدف 
به‌صورت متغیر دودویی باشد از مدل رگرسیون 
لاجستیک برای طبقه‌بندی داده‌ها استفاده می‌شود. در این 
مدل رابطةٌ رگرسیونی متغیرها خطی نیست و به‌صورت 
منحنی ٩‏ شکل است. در این روش پس از محاسبهٌ 
اتضیال ریت مره از اتسمال یی ار ۵ زد 


سال سی و چهارم شمارة دو ۱۶۰۰ 


و کمتر از ۰/۵ به صفر تبدیل می‌شود. رابطةً رگرسیون 
لا جستیک به شکل زیر است [17]. 


)۳( (,1۱۴ < ۲ 
( 26+ مس 2رظ دِ )60 


( ,2+ + یر + ,)60 1 


در این رابطه ۳ احتمال وقوع. 1 ضریب ثابت. ۳ 
راشب زاویه شغی‌ها با عرمن ای قند ۷ نی واه 
و :2 متغیر مستقل است. 


روش جنگل تصادفی یک نوع مدرن از روش‌های 
درحت-پایه است که از تعداد زیادی درخت‌های 
کلاس‌بندی و رگرسیونی تشکیل شده‌است. هم‌چنین 
یکی از روش‌های ناپارامتریک مناسب برای مدل‌سازی 
داده‌های پیوسته و گسسته روش درخت تصمیم می‌باشد. 
جنگل تصادفی بااستفاده از مجموعه‌ای از درخت‌ها با در 
نظر گرفتن " داده مشاهدهُ مستقل ساخته می‌شود. 
بالا می‌برد. هر درخحت تصمیم گیری بااستفاده از یک نمونهةٌ 
تقسیم‌بندی گره‌ها به‌صورت تصادفی انجام می‌شود. در 
روش جنگل تصادفی ور کون ۷ برای تعداد متغیرهای 
کمکی مورد استفاده در هر زیرمجموعه و یا هر گره 
درخت تصمیم و 0066 تعداد درختان مورد استفاده در 


انتخاب متغیرهای پیش‌بینی کننده برای 


جنگل تصادفی است که به‌عنوان پارامترهایی برای این 
روش بایستی تنظیم شود. یکی از قابلیت‌های این روش 
تخمین اهمیت و تأثیر متغیرهای کمکی بااستفاده از تغییر 
خطا در صورت وجود و عدم وجود آن متغیر است [18]. 


روش‌های ارزش گذاری (۷16004 5002102) به کار 
گرفت شده 

الگوریتم درحت تصمیم از حمله روش‌های 

طبقه‌بندی و رگرسیون است که انواع مختلفی دارد. یک 


نشریه مهندسی عمران فردوسی 


شایسته‌ترین صفت‌ها (۱۷۲۵00 «متامع61 ماباطاتتتاه) با 
ویژگی‌ها در سطوح بالاتر يا نزدیک به ريشه است و در 
هر نوع از درخت تصمیم می‌توان از روش‌های مختلف 
ارزش گذاری یا روش‌های انتخاب صفت کمک گرفت. 
یک نوع از درخت تصمیم 1193 است که از روش بهره 
اطلاعاتی (صنوم6) ووتاحصم]ط1) استفاده می‌کند. هرچه 
مقدار این شاخص برای یک ویژگی بالاتر باشد؛ اطلاعات 
پیشتری توسط آن ویژگی گرفته می‌شود و بهتر می‌توان 
مجموعة داده‌ها را براساس آن ویژگی کلاس‌بندی کرد. 
نوع دیگر درخت تصمیم ۲( 4جه ومتاه‌ملتدعملن0 
6 15681695100) است که براساس متغیرهای دودویی 
بنا نهاده شده‌است و از معیاری به نام شاخص جینی 
(10067 نص0)) برای انتخاب صفت‌ها کمک می‌گیرد. هر 
چه شاحص جینی کمتر باشد یعنی آن ویژگی اطلاعات 
بیشتری به ما می‌دهد و می‌تواند در درخحت ساخته‌شده در 
سطوح بالاتر و نزدیک به ريشه قرار بگیرد. معیار دیگری 
به نام بهرةٌ اطلاعاتی نسبی رماع صتوت متاحصمتو) 
وجود دارد که بهتر از شاخص بهرةٌ اطلاعاتی عمل 
می‌کند. در بهرُ اطلاعاتی نسبی از بین ویژگی‌ها. آن‌که 
نسبت بهرةٌ اطلاعاتی به آنتروپی آن بزرگ‌تر باشد وزن 
پیشتری خواهد داشت. معیار بهرة اطلاعاتی خود از معیار 
آنتروپی استفاده می‌کند. روابط (4) تا ()» چگونگی 
محاسبة بهره اطلاعاتی نسبی را بیان می‌کند [19]. 


۱۱/۱ ۵ 63 
< 700 )0۵( 
102 


رابطهٌ () بهرة اطلاعاتی را برای پارامتر (۸) 
محاسبه می‌کند که و با 0 دلالت بر مجموعه داده‌های 


آموزشی دارد: 


۵ 

(ر)و۱00< :۲ 2 < (() ۲۱۲0۵ 
/ س 
1 


نشریه مهندسی عمران فردوسی 


ارزیابی پتانسیل روا نگرایی نحاک در آثر وقوع زمینلرزه .. 


1۷0 
ارماتز 0 
۳71 (() 7۳۲0۳۵ 
)0( 1 


(رل ۱۱۵0۵ < 


کهندی ان » تعداد برچسب کلاس‌های موجود در 
داده‌های آموزشی. ۱ احتمال این‌که نمونه‌ای از داده‌ها 
متعلق به کلاس ام باشد. ۷ تعداد اعضای دامن پارامتر ۸ 
و 1 قسمتی از داده‌های اولیه که مقدار پارامتر آن‌ها زا 
است را نشان می‌دهد. در ضمن 9۱| دلالت بر اندازه 
داده‌های 1 دارد. 

علاوه‌بر معیارهای نام‌برده شده» روش دیگری که 
برای آنالیز حساسیت يا به‌عبارتی ارزیابی اهمیت 
پارامترهای ورودی به‌کار گرفته می‌شود استفاد از معیار 
عنام است. 16۱161۳۲ الگوریتمی است که توسط 16112 
و 1860001 در سال ۱۹۹۲ توسعه یافته‌است [20]. این 
معیار رویکردی با روش فیلتر برای انتخاب پارامترها دارد 
و به‌طور قابل توجهی به روابط بین پارامترها حساسیت 
نشان می‌دهد. این روش امتیازی برای هر پارامتر محاسبه 
می‌کند که می‌تواند برای رتبه‌بندی و انتخاب پارامترهای 
برتر استفاده شود . 


معرفی نرم‌افزار 9 
نرم‌افزار 078086 یک ابزار داده‌کاوی بسیار کارآمد برپاية 
زبان برنامه‌نویسی پایتون است که بااستفاده از آن 
به‌صورت تعاملی و کاملا بصری می‌توان عملیات 
داده‌کاوی را بدون نیاز به کدنویسی انجام داد و خروجی 
مناسبی را تهیه نمود. کار با اين نرم‌افزار به‌صورت 
گرافیکی است؛ به همین دلیل مدل‌سازی‌ها را بسیار آسان 
و قابل فهم کرده‌است؛ به‌طوری‌که به‌صورت هم‌زمان 
امکان کشف اطلاعات از چندین مجموعه داده در طی 
مدل‌سازی‌های مختلف را می‌دهد. این نرم‌افزار هم‌چنین 
دارای ویژگی متن باز (0066: 0060) است و قابلیت 
اضافه کردن کدهای دل‌خواه و تکمیل مدل‌های موجود 
را دارد. نرم‌افزار 6 شامل مجموعه‌ای از 
الگوریتم‌های یادگیری ماشین تحت نظارت برای 
طبقه‌بندی و رگرسیون. روش‌های اعتبارسنجی پراساس 


سال سی و چهارم. شمارة سهء ۱۶۰۰ 


هادی فتاحی- فاطمه جیریایی 


کموگیرداری و آرزبایی قابل یره الگورنتم‌های نون 
نظارت یادگیری برای خوشه‌بندی. الگوریتم‌های قواعد 
انجمنی. الگوریتم‌هایی برای پردازش زبان طبیعی و 
استخراج متن و الگوریتم‌هایی برای تجزیه و تحلیل 
سری‌های زمانی و مدل‌سازی و ... است. 


تحلیل و نتایج 


ارزیابی پتانسیل روان‌گرایی خاک یکی از مسائل 
پیچيدة ژئوتکنیک است که بررسی آن با تأثیر گرفتن از 
چندین فاکتور اعم از خصوصیات خاک شرایط 
زمین‌شناسی و ویژگی‌های حرکت زمین انجام می‌شود. 
در این قسمت به‌منظور پیش‌بینی پتانسیل روان‌گرایی 
خاک در یک پایگاه داده از نرم‌افزار 08086 کمک گرفته 
می‌شود و با به‌کار بستن روش‌های مختلف مدل‌سازی. 
کارایی و عملکرد آنها در یک پیش‌بینی دقیق و صحیح 
مقایسه خواهد شد. این پایگاه داده مربوط به زلزله 
تانگشان به بزرگی ۷/۸ ریشتر است یک فاجعة طبیعی 
که در روز چهارشنبه ۲۸ ژوثیة ۱۹۷۹ در کشور چین رخ 
داده‌است. مرکز زمین‌لرزه در نزدیکی تانگشان در هبی 
([۳1606)» جمهوری خلق چین. یک شهر صنعتی با حدود 
یک میلیون نفر است (شکل ۲ [3]. مشخصات آماری 
این پایگاه داده در جدول (۱) آورده شده‌است. پتانسیل 
روان‌گرایی خاک به‌عنوان متغیر هدف درنظر گرفته 
می‌شود و از نوع دودویی با دو مقدار صفر. یعنی عدم 
رخداد روان‌گرایی و ۱ یعنی رخداد پدیده روان‌گرایی 
می‌باشد. هم‌چنین ورودی مدل‌ها شامل ۱ متغیر قطعی و 
۸ متغیر تصادفی است که عبارتند از بزرگی زلزله (0۷۲) 


سطح آب زیرزمینی (»0» تنش قائم کل ( 0 تنش موثر 


قائم (00» عمق (مل» حداکثر شتاب افقی زلزله در 
سطح زمین (سس0)»؛ نسبت تنش تناوبی (6۱0/ ««۲)؛ 
میانگین اندازهُ دانه‌ها (50)» مقاومت نوک مخروط 
اندازه‌گیری‌شده در آزمایش 0۳۲ (). نمونه‌ها شامل ۷۹ 
داد میدانی روان‌گرایی خاک براساس آزمون نفوذ 
مخروطی هستند. داده‌ها قبل از ورود به مدل بین مقدار 
۱- و ۱ بدون بعد می‌شوند. شمای کلی مدل‌سازی 
انجام‌شده در نرم‌افزار در شکل (4) نشان داده شده‌است. 
در روند مدل‌سازی همان‌طور که مشخص است. در ابتدا 
چیزی که مهم است نرمال کردن داده‌های ورودی است. 
سپس این داده‌های تبدیل يافته به ۵ مدل طبقه‌بندی از 
الگوریتم‌های موجود وارد می‌شوند و مدل‌های 160 
۵ جنگل تصادفی و رگرسیون لاجستیک 
ساخته می‌شوند. درنهایت برای ارزیابی عملکرد آنها از 
امکانات . موجود درهم‌ریختگی 
(تطه۱۲ صمتونگدمی) و نمودار 50۵6 ( 16661۷6۲ 


قانتق: متسشن 


عتاعنته]ع2۲2) ع0062) کمک گرفته شده‌است. 


شکل ۳: نمایی از مکان زلزله تنگشان [۳] 


جدول ۲: مقدار شاعص‌های ارزیابی روش‌های طبقه بندی به‌آزای هر روش 


سال سی و چهارم. شمارهُ دی ۱۶۰۰ 


مدل‌های طبقه بندی ۳۱ دقت طبقه‌بندی | بازیابی مدل 
منحنی ۲50 طبقه‌بندی 
نزدیک‌ترین همسایگی ۰/۹۳۹ ۳ دوز تور 
ماشین بردار پشتیبان ۰۹ ۰۹۳۶ ۰۱:۲ ۰۳۷ 
جنگل تصادفی ۰۹۳۸ ۸۸۲ ۸۷ ۱,۸۸۹ 
شبکه عصبی هوشمند ۰۹ ۰۹۳۵ ۰۳۸ ۰۳۷ 
رگرسیون لاجستیک ۰۹۷۹ ۰۱۹۳۹ ۰۱۳۹ ۰۳۷ 
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ارزیابی پتانسیل روانگرایی حاک در اثر وقوع زمین‌لرزه .. 
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شکل ۶: شمای کلی مدلسازی انجام شده در نرم‌افزار 0286 


در جدول (۲) برای هر مدل طبقه‌بندی مقدار 
شاخص‌های مختلفی محاسبه شده‌است و براساس آنها 
می‌توان به مقايسةٌ عملکرد مدل‌ها پرداخت. همه 
شاخص‌های به‌کاربرده شده از طریق ماتریس 
درهم‌ریختگی به‌دست. آمده‌اند. در این جدول ۸۱ 
(متامته‌امدهط عصناهع(0 66061۷6۲ مساحت زیر 
منحنی 18606 ۸) نسبت نمونه‌های درست پیش‌بینی‌شده 
به تعداد کل نمونه‌ها. ۳۲6615100 نسبت نمونه‌های مثبت 
صحیح به تعداد نمونه‌هایی که مثبت پیش‌بینی شده‌اند 
11 نسبت نمونه‌های مثبت صحیح به تعداد 
نمونه‌هایی که در واقعیت مثبت بوده‌اند و ۳۱ یک میانگین 
هارمونیک وزن‌دار شده دو شاخحص 66۵11 و ۳6۵19100 
می‌باشد که در رابطةً 02 بیان شده‌است. 
)۳ [[۵۵ع۲۶ ۷« ۳۲۵۵[5[00 < 2 #9 
آلوعع + ممزوزم‌م۳ . - 1 
شکل (۵) ماتریس درهم‌ریختگی مدل ماشین بردار 
پشتیبان را نشان می‌دهد. باتوجه به تعاریفی که از معیارها 


نشریه مهندسی عمران فردوسی 


مان داز هر تیان کر سل ۳ اراس( 
(۱۱) محاسبه می‌شود. بایستی دقت کرد که درمورد دو 
معیار دقت و بازیابی در هرکلاس به‌طور مجزا محاسبه 
می‌شود و از آنها میانگین وزن‌دار گرفته می‌شود. وزن هر 
کلاس متناسب با نسبت نمونه‌های آن کلاس به تعداد کل 


نمونه‌ها است. 
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شکل ۵: ماتریس درهم ریختگی مدل در نرم‌افزار 072086 


قانيبة مدل‌ها. پاسفاده از قاصن, اهر در 
جدول (۳) آورده شده‌است. در این جدول مدل‌ها دوبه‌دو 
پراساس یک شاخحص ارزیابی انتخابی با یکدیگر مقایسه 
می‌شوند. این مقایسه‌ها بااستفاده از تفسیر بیزی از آزمون 
| است. عددی که در جدول در هر سلول نوشته 
شده‌است بیانگر آن است که به استمال زیاد همان عدد 
مدل مربوط به سطر سلول از مدل مربوط به ستون سلول 
بهتر است. جدول (۲) نیز همانند این جدول نتیجه‌گیری 
مشابه دارند و از هر دو می‌توان یک نتيجه را برداشت 
کرد. بااستفاده از آنها می‌توان گفت که براساس شاخحص 
0 روش رگرسیون لاجستیک بهترین روش است؛ اما 
اگر این شاخص را نادیده بگيریم براساس سایر 
شاخص‌ها روش‌های 6۷۷ ۸۲ و رگرسیون 
لاجستیک عملکردی مشابه هم دارند و از هر سة آنها 
می‌توان برای پیش‌بینی استفاده کرد. یکی از روش‌های 
مقایسهٌ عملکرد مدل‌های طبقه‌بندی دودویی ( 1027۷ظ 
عنوو12)) استفاده از نمودار مشخصه عملکرد 0 


است. ارزیابی عملکرد مدل‌های طبقه‌بندی دودویی 
معمولا بااستفاده از شاخص‌هایی به نام حساسیت 
( ۷1 911ع6) و بازیابی (6211ع) انجام می‌شود؛ 
درحالی که این نموذار هر دو شاخص را دارا می‌باشد و 
موجب بررسی هر دوی آنها به‌صورت هم‌زمان می‌شود. 
در نمودار مشخصه عملکرد بر محور افقی نرخ مثبت 
کاذب ۲۳۶ (266 ۳۵۵۷6۵ ۳2150) و بر محور عمودی 
نر خ مثبت صحیح ۶ ۵/6 ۳۵51۷ 1۳06) قرار 
می‌گیرد. در اين نمودار یک خط قطری وجود دارد که 
ناحیةٌ بالای این خط. ناحیٌ مطلوب و ناحیهٌ زیر آن ناحیة 
نامطوب محسوب می‌شود. منحنی ترسیم‌شده برای هر 
مدل طبقه‌بندی هرچه به بالا و سمت چپ نمودار 
نزدیک تر باشد از توانایی و دقت بالاتری برای تشخیص 
صحیح کلاس داده‌ها برخوردار است. به‌عبارت دیگر 
می‌توان گفت. روشی که دقت و کارایی بالاتری دارد 
منحنی آن در نمودار 806 مساحت بیشتری را در زیر 
خود شامل می‌شود. در نمودار شکل (1) همان‌طور که 
مشخص است منحنی مربوط به روش رگرسیون 
لاجستیک نسبت‌به سایر آنها بالائر است و پس‌از آن 
منحنی مربوط به روش 160 قرار می‌گیرد و پایین‌تر از 
همه روش جنگل تصادفی می‌باشد. 


جدول ۲ مقایسه دو به دو مدل‌ها براساس شاخحص ۸0 
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ارزیابی پتانسیل روا نگرایی نحاک در اثر وقوع زمین‌لرزه . 
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شکل 1: نمودار مشخصه عملکرد روش‌های طبقه‌بندی هوشمند 


جدول ۶ مقایسه نتایج تحقیقات مختلف در مورد یک مطالعه 


موردی 
محققین مدل هه | مرجع 
۵ ,2606 5۹( ۰/۹۹۳ [۳ 
۷۵ ,26116 ۳۹0-۷7۲ ۰۹۹۵ ۳ 
تحقیق حاضر | رگرسیون لاجستیک | ۰/۹۲۳۷| - 


در جدول (۶) نتایج عملکرد سه مدل براساس معیار 
صحت طبقه‌بندی بیان شده‌است. دو مورد از مدل‌ها در 
تحیقانت دیگزی اتجام ده که مدل‌سازی‌ها بضورت 
دستی بوده‌است. در این تحقیق نیز مدل رگرسیون 
لااجستیک برای مقایسه انتخاب شده‌است. نتایج تحقیق 
حاضر در مقایسه با دو تحقیق دیگر ]21 ,3] نشان می‌دهد. 
نتایج با اختلاف اندکی به هم شبیه هستند؛ ضمن این که 
نرم‌افزار 6 کار مدل‌سازی را بسیار اسان نموده‌است 
و در کوتاه‌ترین زمان می‌توان انواع مدل‌ها را ساخت و 
ازوبانی کر 

در نمودار شکل (۷) سه شاخص ۵ ۸ و 
0 به‌دست‌آمده از هر یک از مدل‌های طبقه‌بندی 
هوشمند با هم مقایسه شده‌اند. همان‌طور که نشان داده 
شده‌است روش رگرسیون لاجستیک براساس شاخحص 


نشریه مهندسی عمران فردوسی 


با اختلاف زیادی روش برتر محسوب می‌شود؛ اما 
اگر این شاخحص را کنار بگذاریم» روش‌های رگرسیون 
لاجستیک, شبک؛ٌ عصبی مصنوعی و ماشین بردار پشتیبان 
پراساس دو شاخص دقت و صحت طبقه‌بندی هوشمند 
نسبت‌به دو روش دیگر بهتر عمل می‌کنند و می‌توان گفت 
عملکرد نزدیک به هم دارند. هم‌چنین اين نمودار نشان 
می‌دهد که روش جنگل تصادفی نسبت‌به سایر روش‌ها 
عملکرد ضعیفی دارد. 

شکل (۸) انجام یکی دیگر از قابلیت‌های نرم‌افزار 
6 به نام 21 را نشان می‌دهد که به رتبه‌بندی و 
امتیازدهی متغیرها باتوجه به ارتباط آنها با متغیر هدف 
شیاه ی انم کار وا پراتانشن. وهای مات 
ارزش گذاری مانند روش‌های بهرهٌ اطلاعاتی. بهره 
اطلاعاتی نسبی, شاخص جینی و شاخص 1861161۳ انجام 
می‌دهد. خروجی این عملیات در جدول (۵) نشان داده 
شده‌است. بر این اساس متغیر مقاومت نوک مخروط در 
آزمایش ۳1) با اختلاف بسیاری در هر چهار معیار در 
اولویت اول قرار گرفته‌است. به این معنی که مژثرترین 
متغیر در کلاس‌بندی صحیح داده‌ها می‌باشد. 


سال سی و چهارم شمارة سه. ۳۹۹2 
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شکل :٩‏ نمودار پراکندگی متغیرها 


نشریه مهندسی عمران فردوسی سال سی و چهارم. شمارة سه. ۳3۳ 


هادی فتاحی- فاطمه جیریایی 


برای بررسی سه متغیری که بیشترین تأثیرگذاری را 
در روند مدل‌سازی داشتند. نمودار پراکندگی آنها در 
شکل )٩(‏ رسم شده‌است تا تغییرات دوبه‌دوی متغیرها 
نسبت‌به یکدیگر مشخص شود. همان‌طور که نشان داده 
شده‌است. بین دو متغیر نسبت تنش تناوبی (73) و حداکثر 
شتاب در سطح زمین (۳) و هم‌چنین دو متغیر مقاومت 
نوک مخروط (60) و حداکثر شتاب در سطح زمین (۳) 
هم‌بستگی و نظم خاصی مشاهده نمی‌شود؛ اما بین دو 
متغیر مقاومت نوک مخروط (60) و نسبت تنش تناوبی 
(13 در هر کلاس از روان‌گرایی. یک جهت گیری تقریبی 
وجود دارد به‌طوری که داده‌ها با کلاس ۱ در سمت چپ 
نمودار و داده‌ها با کلاس صفر در پایین نمودار تجمع 
یافته‌اند. 

نتیجه گیری 

ارزیابی پتانسیل روان‌گرایی خاک درخحصوص 
پایگاه داد زلزلةٌ تنگشان با ۵ الگوریتم طبقه‌بندی 
هوشمند. رگرسیون لاجستیک. 5۷۲ 16 ۸۵۱۲ و 
جنگل تصادفی و با کمک نرم‌افزار 0:۵086 صورت 
گرفت. مدل‌سازی از ٩‏ متغیر عددی ورودی و یک متغیر 
کیفی هدف تشکیل شده بود. نتایج این تحقیق نشان 


می‌دهد: 


وت 


8 


9 مدل‌های طبقه‌بندی هوشمند انجام‌شده برای پیش‌بینی 
تتاتشیام زوان گرا اک ای ناش ی تفت باس 
برخوردار هستند. باتوجه به مقایسه‌هایی که براساس 
معیارهای مختلف بین روش‌ها انجام شد. روش 
رگرسیون لاجستیک براساس شاخص ۸1۳ بهترین 
روش معرفی شد. 

٩‏ براساس شاخص‌های بازیابی. دقت و صحت 
طبقه‌بندی. سه مدل رگرسیون لاجستیک. 5۷1۷ و 
۸ عملکردی نزدیک به هم داشتند و از دقت و 
صحت بالایی برخوردار بودند. در بین مدل‌سازی‌ها. 
مدل جنگل تصادفی نسبت‌به سایر مدل‌ها عملکرد 
ضعیف‌تری داشت. 

* بررسی تأثیرگذاری متغیرهای ورودی و ارزش گذاری 
آنها براساس چهار معیار بهرة اطلاعاتی» بهرة اطلاعاتی 
اشتییم اک سناکس مزا تسان باه سر 
مقاومت نوک مخروط در آزمايش ]۳ اندازه‌گیری 
شده. نقش عمده‌ای در پیش‌بینی صحیح کلاس 
روان‌گرایی خاک داشته‌است و پس از آن هم متغیرهای 
نسیت ین تاوبي و حداکر شتاب هی زلرله در مسطلح 
زمین از تأثیرگذاری بالایی در مدل‌سازی‌ها برخوردار 
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